\newpage
\subsubsection{Validation biologique sur des jeux de séquences réelles}
~\\

Les tests ont été effectués avec Sylvain LEGRAND chercheur en biologie à l'Université Lille 1 au SADV\footnote{Stress Abiotiques et Différenciation des Végétaux Cultivés}. On a pu tester le programme sur de vraies séquences contenant des microARNs. Plus particulièrement sur les séquences d'{\em Arabidopsis thaliana} qui est une espèce de plantes appartenant à la famille des Brassicacées. Elle est appelée Arabette des dames. Désignée comme organisme-modèle aussi bien pour la recherche végétale que pour l’évolution, la génétique ou encore la recherche fondamentale, elle a pu être totalement séquencée. 
\\

Le retour de Sylvain sur les résultats a permis d'améliorer le programme actuel en plusieurs points:

\paragraph{Des pre-miARNs identiques}
~\\

Malgré le traitement des structures identiques de RNALfold, on constate toujours des redondances. Ceci est dû au fait que, pour deux structures différentes, elles présentent une même sous structure qui correspond à un précurseur de microARN. 
\\

Les deux structures P et Q sont différentes mais ont exactement la même sous structure A. Du coup lors de la recherche de candidats, si la structure A correspond à pre-miARN on aura dans les résulats deux fois celui-ci.
\\

La façon la plus simple de résoudre est d'utiliser une matrice de la même manière faite pour traiter les prédictions de RNALfold. Pour une structure k à chaque pre-miARN trouvé entre les positions $i$ et $j$ on met la valeur k dans le tableau à la position $i$,$j$ si cette case est vide et donc qu'on n'ait pas déjà trouvé de candidat ($i$,$j$).
\paragraph{Une sortie compatible avec RNAeval}
~\\

À ce stade, le programme retournait les candidats dans un format fasta (cf figure \ref{entree}) avec en plus la position de début et de fin du précurseur. Mais il fallait également donner l'information sur la structure secondaire au format vienna dot-bracket, pour que ce soit compatible avec RNAeval. Cet outil sera utilisé par la suite dans le projet pour calculer l'energie MFE\footnote{Minimum Free Energy} des pre-miARN
 trouvé et permettra de diminuer les faux positifs\footnote{precurseur ne présentant pas de microARN} en ne gardant qu'une partie des candidats qui ont une MFE spécifique.
Avec l'exemple de la figure \ref{entree}, si le pre-miARN se situe entre les positions 30 et 53. 
\\
\\
\begin{figure}[h]
$\mathit{>ath-MIR5657\_30-53}$\\
$\mathit{GUGUAGAGGCCUAAACCAGUACAC}$\\
$\mathit{(((((..((......))..)))))}$
\caption{\label{sortie_rna_stem} Sortie du programme}
\end{figure}
~\\ 
